查看原文
其他

如何1秒钟创作出一幅水墨山水画?

造就Talk的编辑们 造就 2019-04-24






造就第397位讲者 周乐

西交利物浦大学(XJTLU)



大家好,我叫周乐。我是一个新媒体艺术家,也是一个技术创造者。


今天我带来的演讲,标题是“达达山水——AI可以赋能我们的创造力吗?”


我认为,这是一个太难回答的问题。当然这里我也不是简单地扔出这个问题,我没有一个yes或no的武断论断。但是我选择以一个,我新近完成的基于人工智能的交互媒体艺术装置——达达山水,来和大家探讨一下这个问题的可能性。


首先我想先谈一下山水



关于山水,我觉得它是发源于中国,盛行于东方的一种用笔刷和水墨去创造的艺术。在我们古代它另外一个名字叫做文人画。是文人四艺,琴棋书画的一部分。


换言就是说,在原来所有受过高等教育的士大夫、文人,他们都具备使用水墨山水这样一种非常有东方特色的艺术形式,去进行表达的能力。



对于我们东方人而言,当我们谈到山水,不用去强调大家都会知道,有一个概念叫做山水的写意精神


而在写意精神的另外一侧,叫做山水的技法


咱们的山水画是分流派的,这些流派不以写意精神区分,不存在哪一个流派说我们这一派没有写意精神。


写意精神是大家共享的,但山水画的技法是多样的。


有一个比较有意思的事情,我是不会画山水画的,我不知道在座有多少人会画。


但是我发现你可能会指着某一幅画,觉得这一幅非常山水,指着另外一幅觉得那不是很山水,我想在座的大家都可以很自信地对一幅山水画做出这样的论断。



而我对这一现象的解读是:不管我们会不会画山水画,山水的写意精神都流淌在我们的血液当中


那,我们缺的是什么?


我们缺的是半年、一年、甚至三年五年的,关于山水技法的训练。


但是,比如我,你让我现在去花三年的时间学习山水技法,我觉得对我来说太难了。


我有一个观点,如果一个事情非常难,你又非常想让它完成,怎么办?找AI帮忙!


这里有一个很简短的演示,就是我的交互艺术装置。先给大家看一下它究竟能干什么?



好的,现在我们可以来具体谈谈,我到底做了些什么?


有一天下午,我发现了一个非常成功的人工智能模型的一个小bug。


它具体是什么呢?就是它本来应该尝试着将一张图片里的野马识别出来,并且将它转换成一匹斑马。


然后好玩的事情是什么?这个人工智能会错误地将我认成一匹马,并且转换成一匹斑马。



当我在测试这个模型的时候,在我们那个楼里面,有一个李开复博士的演讲。这两件事情是同一时间,同一地点发生的。我非常想去听一下李开复博士的演讲,但当我测试这个模型的时候,忘记了时间,他的演讲已经结束了。



为什么我会把这两个事情放在一起来说?


因为李开复这个演讲的标题是“AI Superpowers”,AI的超级霸权。


他认为,AI是超级霸权,AI将改变世界格局,甚至将取代人类。


这个我相对不怎么关心,我关心的是,AI能不能做一点有温度的事情、好玩的事情,AI能不能和我们一起做点什么事情?

那么刚才我提到的那个,我玩了半天以至于错过演讲的人工智能模型究竟是什么呢?


首先它是一个神经网络。更具体地来讲,它是深层对抗网络,我给它取了一个名字叫做“自感生成网络”。



在去年的7月份,UC伯克利的一个实验室里,一帮非常厉害的科学家、AI研究者,发布了这样一个模型。


他们用这个模型干什么呢?


将一张莫奈的画,变成一张真实的图片;

将一张斑马的照片,转移成野马的照片;

将一个地方冬天的风景,转移成春天的风景;

把一个A画家的画,转换成B画家的风格。



诸如此类。简单来讲,就是做一个风格的转换。


而我用它干了什么事情呢?


我让它把我们的山水手绘线稿,变成水墨山水画。因为我刚才说了:复杂的事情咱们让AI来做。


我说我们有水墨精神、有写意精神。但是我不会山水技法,没有关系。我用简笔画的方式
我总能勾勒出我心中的山水吧。而技法的部分,让AI来帮我实现。


这就是我的项目——达达山水(DaDA:Draw and Design With AI)。我最终把它做成了一个交互式的装置,参与者在iPad上去勾勒心中的水墨山水,然后人工智能会帮他完成。



具体我是怎么做出来的?


首先我从台北故宫博物院的网站上,扒取了108张高清的历代山水画大师的作品。


在这里我特意选择模糊掉技法,不专门找某一个风格,或者某一个大师的作品。而是选择历代所有杰出大师的作品,作为一个山水画的代表。


然后我进行了一系列的计算机视觉手段的处理。简单来讲就是要完成一个事情,要把山水画的画芯给抽取出来。因为这部分才是真正的山水画。


在这里,我遇到了一个问题。


咱们知道山水画有横的长轴,还有竖的条幅。但是我如果要训练人工智能的话,它还没有智能到那个程度,可以随便我输入什么尺寸都可以。它需要我输入一个固定的尺寸。


那么问题就来了,那些大师作品已经在那里了,我改变不了它。所以我想了一个办法,我把这些图都给切成一个一个正方形的框。把一张大师的作品变成多张的。



本来这是一个技术妥协。但好处是,虽然我只找到了108张大师山水作品,但经过这么一处理之后,我有了1230张大师山水作品。


训练AI,数据总归是越多越好的。


再进一步,我通过一些计算机视觉的手段,以大师的山水画作为起点,反向生成边界,
这些是我前面提到的风格A,也就是我们的手绘数据,然后进行训练。


AI只是一段乱码,他可以帮我做这个事情,不代表我立马说:嘿,AI帮我做这个


所以接下来,我写了一个前后端软件,前端就是在iPad上,后端在服务器上。并且将iPad连接到一块大屏上,组成这样一个交互艺术装置。



这个就是你可以看到的iPad界面。


点击Reload,就可以开始画你心中的山水画的线稿。


点击DaDA,就可以呼叫“达达山水”这个人工智能的帮助,帮你完成一幅水墨山水。



我观察到,AI大概可以画出这样六种不同风格的山水。



在我和别人交流过程中,经常会被问到两个问题。第一个问题就是:在这里,AI到底学了什么?


简单来讲,这里面有两个东西。一个叫generator,生成器。另一个叫discriminator,姑且称之为辨别器。



生成器始终不断地在尝试生成一张山水画,鉴别器则更像一个鉴别画作的人员。他始终在尝试着去看这幅画到底是生成的还是真的。


这里面就有一种对抗关系。生成器永远尝试着去生成一张更加逼真的山水,鉴别器永远不断地在提升自己,希望去鉴别出这幅画到底是生成的还是真实的?


这两者就是一个对抗关系,在对抗中成长,永远是最容易的。


所以,我就不停地让生成器去生成新的山水,让辨别器去甄别这幅画是真是假。



经过20多个小时的学习,他们彼此对抗,彼此提升自我。然后就到了某一个点,生成器就可以生成,足够逼真或者真实的山水画。


这个时候我就抛弃掉了辨别器,我把生成器单独地拿出来,作为这个交互艺术装置的生成内核。


这就是,AI所学到的东西,以及他在帮我生成的东西。


另外一个我经常会被问到的问题是:达达山水要从手绘的数据转移成水墨山水,可在训练他的时候,用的是这种生成的边界数据,和我手画得一点都不像,怎么解决?

这是我还没有接触的一部分,AI要数据,可要数据是很难的。


我如何才能得到人的数据呢?那我只能花钱请很多人来画,对不对?


但是我没有很多钱请人,所以我就想了一个办法。当我第一轮,姑且称之为达达山水1.0训练完成的时候,我把它带到了上海创客嘉年华,在那布置了三天,邀请所有来上海创客嘉年华现场的人,和达达山水一起去创作。



最后大约有780人次和达达山水一起完成过水墨山水,相当于我就有了780张真人的手绘数据。然后我重新用真人手绘数据的样本,去训练人工智能模型。


我手上即将和大家演示的就是达达山水2.0。你们现在看到的,就是和我一样的画面,这个是实时的演示。


比如说我想勾勒一下山水,我有山,我有水,然后我觉得OK差不多,这就是我心中想象的山水,现在我应该做什么,找达达帮忙。我没有三年或者五年的时间去学习画山水画,所以这是我的方式。



好了,这个就是刚才,我和人工智能“达达山水”,合作完成的一幅水墨山水。



我来梳理一下,这个项目,整个的一个进程,具体都发生了什么。

首先,我使用大师山水,并且用计算机生成的线稿,去训练出达达山水。它已经具备帮我们画山水画的能力了。


之后,我把它带到了上海创客嘉年华的现场,达达山水在那里帮助了很多人,很多不会画山水的人,完成了或许是他们人生中的第一幅水墨山水。


然后我将我们人类的手绘数据,再一次地使用到训练人工智能达达上,然后达达再一次地从我们的数据,学到了一个更好的版本,去创造水墨山水。


在上台演示的两个月前,我不断地在尝试着使用达达山水去进行创作。我不断地去理解达达山水是怎么样帮我创造的。


每当我们有一个新伙伴、有一个新工具,我们需要磨合才能达到最佳的效果。所以这个过程中,我是在学习如何和它一起创造。

那在这个过程中,是我训练的它?还是它训练了我?


更进一步的说,到底谁在帮助谁?



有时候我会觉得,我肯定是帮到达达山水的,我要是不帮它,它肯定不能自己冒出来?


但我更多的时候,我觉得他在帮助我。

所以在最后希望再一次把这个问题,抛给大家:


人工智能可以赋能我们的创造力吗?


文字 | 张默;校对 | 其奇



互动话题:

人工智能可以赋能我们的创造力吗?

每周评论区,被zan最多的评论者,将获得造就送出的礼品一份


加入社群:

添加小编微信(zaojiu12),发送暗号“进群”,带你进入神秘的造就官方群。



推荐阅读




  点击阅读原文,看「造就」更多演讲。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存